期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于改进互信息和邻接熵的微博新词发现方法
夭荣朋, 许国艳, 宋健
计算机应用    2016, 36 (10): 2772-2776.   DOI: 10.11772/j.issn.1001-9081.2016.10.2772
摘要853)      PDF (729KB)(589)    收藏
针对目前微博新词发现算法中的数据稀疏、可移植性较差以及缺乏对多字词(大于三字)识别的问题,提出了基于改进互信息(MI)和邻接熵(BE)的微博新词发现算法——MBN-Gram。首先,利用 N元递增算法(N-Gram)提取新词的候选项,对提取出来的候选新词使用频率和停用字等规则进行过滤;接着再利用改进MI和BE对候选项进行扩展及再过滤;最后,结合相应词典进行筛选,从而得到新词。通过理论及实验分析,MBN-Gram算法在准确率、召回率及 F值上均有一定提高。实验结果表明,MBN-Gram算法是有效可行的。
参考文献 | 相关文章 | 多维度评价
2. 基于差分隐私的数据匿名化隐私保护方法
宋健, 许国艳, 夭荣朋
计算机应用    2016, 36 (10): 2753-2757.   DOI: 10.11772/j.issn.1001-9081.2016.10.2753
摘要730)      PDF (791KB)(684)    收藏
在保护数据隐私的匿名技术中,为解决匿名安全性不足的问题,即匿名过程中因计算等价类质心遭受同质性和背景知识攻击造成的隐私泄漏,提出了一种基于差分隐私的数据匿名化隐私保护方法,构建了基于差分隐私的数据匿名化隐私保护模型;在利用微聚集MDAV算法划分相似等价类并在匿名属性过程中引入SuLQ框架设计得到 ε-MDAV算法,同时选用Laplace实现机制合理控制隐私保护预算。通过对比不同隐私保护预算下可用性和安全性的变化,验证了该方法可以在保证数据高可用性的前提下有效地提升数据的安全性能。
参考文献 | 相关文章 | 多维度评价